Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Résolution optimale de DEC-POMDPs par recherche heuristique

Identifieur interne : 004B10 ( Main/Exploration ); précédent : 004B09; suivant : 004B11

Résolution optimale de DEC-POMDPs par recherche heuristique

Auteurs : Daniel Szer [France] ; François Charpillet [France] ; Shlomo Zilberstein [États-Unis]

Source :

RBID : ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F

Abstract

Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.
We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.

Url:
DOI: 10.3166/ria.21.107-128


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
</author>
<author>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F</idno>
<date when="2007" year="2007">2007</date>
<idno type="doi">10.3166/ria.21.107-128</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-B2V0R924-2/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">000E59</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">000E59</idno>
<idno type="wicri:Area/Istex/Curation">000E47</idno>
<idno type="wicri:Area/Istex/Checkpoint">000E91</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">000E91</idno>
<idno type="wicri:doubleKey">0992-499X:2007:Szer D:resolution:optimale:de</idno>
<idno type="wicri:Area/Main/Merge">004C44</idno>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00119482</idno>
<idno type="url">https://hal.inria.fr/inria-00119482</idno>
<idno type="wicri:Area/Hal/Corpus">006547</idno>
<idno type="wicri:Area/Hal/Curation">006547</idno>
<idno type="wicri:Area/Hal/Checkpoint">003B93</idno>
<idno type="wicri:explorRef" wicri:stream="Hal" wicri:step="Checkpoint">003B93</idno>
<idno type="wicri:doubleKey">0992-499X:2007:Szer D:resolution:optimale:de</idno>
<idno type="wicri:Area/Main/Merge">004F07</idno>
<idno type="wicri:Area/Main/Curation">004B10</idno>
<idno type="wicri:Area/Main/Exploration">004B10</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
<affiliation wicri:level="4">
<country xml:lang="fr">États-Unis</country>
<wicri:regionArea>Department of Computer Science, University of Massachusetts Amherst, Amherst, MA01003</wicri:regionArea>
<placeName>
<region type="state">Massachusetts</region>
<settlement type="city">Amherst (Massachusetts)</settlement>
</placeName>
<orgName type="university">Université du Massachusetts à Amherst</orgName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">États-Unis</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="2007-01">2007</date>
<biblScope unit="vol">21</biblScope>
<biblScope unit="issue">1</biblScope>
<biblScope unit="page" from="107">107</biblScope>
<biblScope unit="page" to="128">128</biblScope>
<biblScope unit="page-count">128</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="mix" xml:lang="it">
<term>DEC-POMDP</term>
<term>Markov Decision Processes</term>
<term>decentralized control</term>
<term>planning</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.</div>
<div type="abstract" xml:lang="en">We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
<li>États-Unis</li>
</country>
<region>
<li>Grand Est</li>
<li>Lorraine (région)</li>
<li>Massachusetts</li>
</region>
<settlement>
<li>Amherst (Massachusetts)</li>
</settlement>
<orgName>
<li>Université du Massachusetts à Amherst</li>
</orgName>
</list>
<tree>
<country name="France">
<region name="Grand Est">
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</region>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</country>
<country name="États-Unis">
<region name="Massachusetts">
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</region>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 004B10 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 004B10 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F
   |texte=   Résolution optimale de DEC-POMDPs par recherche heuristique
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022